Ontologiegestuetzte Suche in unstrukturierten Daten
Veranstalter:
Mitwirkung:
Kai
Simon
Geb. 051, Raum 01-026
Thomas
Hornung
Geb. 051, Raum 01-028
Sprache: Deutsch/Englisch
ECTS: 16 (Master) / 6 (Bachelor)
Zeit, Ort & Organisatorisches:
Für diese Veranstaltung ist eine vorherige Anmeldung per Mail an Kai Simon erforderlich (Bitte Matrikelnummer, Prüfungsordnung, Fachsemester angeben). Die endgültige Teilnehmerliste wird bei der Einführungsveranstaltung am 25.10.07 bekannt gegeben.
Raum: Geb. 051, SR 00-006
Zeit: Donnerstag, 16 - 19 Uhr (s.t)
Curriculumeinordnung:
- Bachelor of Science: 5. Semester (Projekt)
- Master of Science: 3. Semester (Team Projekt)
Folien:
Inhalt:
Das Web dient heutzutage in vielen Bereichen als eines der wichtigsten Informationsquellen.
Doch durch die Größe des Webs führt der Weg zur Informationsquelle zumeist über den Gebrauch eines
Suchdienstes. Suchdienste versuchen soviel Informationen wie möglich zu sammeln und zu indexieren um ein
großes Spektrum des Webs abdecken zu können. Ein wesentlicher Bestandteil einer jeden Suchmaschine ist
der Crawler, der neue Informationsquellen erschließen soll aber auch alte bereits indexierte Informationen
auf dem neusten Stand hält.
Im Rahmen des Projekts beschäftigen wir uns mit Crawlern, die nicht
wahllos nach neuen Informationen suchen, sondern zielgerichtet, fokussiert neue Quellen indexieren.
Ausgehend von einer Ontologie, die eine genauere Beschreibung der gewünschten Information beinhaltet, werden
neue Informationsquellen identifiziert und bewertet. Ontologien sind ein zentraler Bestandteil des World
Wide Web genauer des Semantic Webs. Sie ermöglichen, dass Zusammenhänge zwischen Objekten der realen
Welt implizit und explizit ausgedrückt werden können.
Ziel:
Ziel ist der Entwurf eines Fokus-Crawlers, der Daten zielgerichtet aus dem Web sammelt und indexiert. Zur Abspeicherung der gefunden Information soll ein Indexformat umgesetzt werden, dass eine effiziente Verwaltung der Daten ermöglicht. Die gesammelten Daten sollen schließlich zur maschinellen Weiterverarbeitung in eine semantische Form überführt werden.
Prüfungsleistungen: (Bachelor)
Für den erfolgreichen Abschluss des Projekts sind neben der Realisierung eines Teilprojekts auch die Dokumentation, ein Projektprotokoll und die Präsentation der Ergebnisse erforderlich.